1
Переход к вычислениям, ориентированным на пропускную способность
AI021Lesson 1
00:00

Вычислительная техника пережила фундаментальный сдвиг от оптимизированной по времени задержки проектирования процессора к ориентированной на пропускную способность архитектуре графических процессоров. В то время как процессор подобен скоростному мотоциклу доставки (быстрый для одного пакета), графический процессор — это огромный грузовой корабль: он движется медленнее на один элемент, но одновременно перевозит 50 000 контейнеров.

1. Задержка против пропускной способности

Процессоры разрабатываются с целью минимизации «времени выполнения» для одной последовательности инструкций с помощью сложной предсказания ветвления. Напротив, графические процессоры (GPU) разработаны для максимизации «работы в секунду», выполняя тысячи потоков параллельно, жертвуя скоростью одного потока ради огромной общей пропускной способности.

ЦПУ (оптимизировано по времени задержки)УправлениеБольшой кэш (L3)АЛУGPU (оптимизировано по пропускной способности)Много маленьких АЛУ

2. Распределение транзисторов

Графический процессор обеспечивает гораздо более высокую пропускную способность команд и полосу пропускания памяти, чем центральный процессор при аналогичном ценовом и энергетическом уровне. ГПУ специализируются на высокоуровневых параллельных вычислениях и используют больше транзисторов на блоки обработки данных (АЛЮ), в то время как ЦПУ уделяют больше транзисторов кэшированию данных и управлению потоками.

3. Эволюция CUDA

Архитектура унифицированного вычислительного устройства (CUDA) была представлена компанией NVIDIA в 2006 году. Это платформа и модель параллельных вычислений, которая позволяет значительно повысить производительность за счёт использования мощности графического процессора независимо от графических интерфейсов приложений.

main.py
TERMINALbash — 80x24
> Ready. Click "Run" to execute.
>